Evaluation of Various DR Techniques in Massive Patient Datasets using HDFS

نویسندگان

چکیده

The objective of comparing various dimensionality techniques is to reduce feature sets in order group attributes effectively with less computational processing time and utilization memory. reduction algorithms can decrease the dataset consisting a huge number interrelated variables, while retaining dissimilarity present as much possible. In this paper we use, Standard Deviation, Variance, Principal Component Analysis, Linear Discriminant Factor Positive Region, Information Entropy Independent Analysis using Hadoop Distributed File System for massive patient datasets achieve lossless data acquire required knowledge. experimental results demonstrate that ICA technique efficiently operate on eliminates irrelevant without loss accuracy, reduces storage space also computation compared other techniques.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

using game theory techniques in self-organizing maps training

شبکه خود سازمانده پرکاربردترین شبکه عصبی برای انجام خوشه بندی و کوانتیزه نمودن برداری است. از زمان معرفی این شبکه تاکنون، از این روش در مسائل مختلف در حوزه های گوناگون استفاده و توسعه ها و بهبودهای متعددی برای آن ارائه شده است. شبکه خودسازمانده از تعدادی سلول برای تخمین تابع توزیع الگوهای ورودی در فضای چندبعدی استفاده می کند. احتمال وجود سلول مرده مشکلی اساسی در الگوریتم شبکه خودسازمانده به حسا...

evaluation of sadr eminence in safavid period

چکیده: یکی از دوره های مهم تاریخی ایران به لحاظ تأمین استقلال ملی مذهبی و حتی تأثیر آن بر فرهنگ و مذهب ایرانیان، دوره صفویه است. رسمیت دادن و رواج مذهب شیعه توسط شاه اسماعیل اول، یکی از مهمترین اقدامات این دولت محسوب می شود. بنابراین برای اجرای این سیاست، وی منصب صدارت را به عنوان منصبی مذهبی- حکو متی ایجاد کرد .این منصب از دوره ی تیموریان ایجاد شده بود ولی در اواخر این دوره اهمیت بیشتری یافت...

15 صفحه اول

Massive Datasets in Astronomy

Astronomy has a long history of acquiring, systematizing, and interpreting large quantities of data. Starting from the earliest sky atlases through the first major photographic sky surveys of the 20th century, this tradition is continuing today, and at an ever increasing rate. Like many other fields, astronomy has become a very data-rich science, driven by the advances in telescope, detector, a...

متن کامل

A Comparative Analysis of Various Clustering Techniques on Random Datasets

ata Mining is a discovery of knowledge used basically used for finding or exploring the new facts among datasets. It allows the user to find the hidden data among available datasets. Data mining consists of various components including clustering, classification, association rules, sequence analysis etc. Unlabeled data are becoming common and mining such databases becomes more challenging. Clus...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: International journal of recent technology and engineering

سال: 2021

ISSN: ['2277-3878']

DOI: https://doi.org/10.35940/ijrte.d6508.1110421